O processamento de linguagem natural tornou-se uma área muito explorada devido
ao desejo da interatividade de comunicação do homem com a máquina usando a
mesma linguagem utilizada para comunicar-se com outro ser humano.

O uso de processamento de linguagem natural tem como princípio a
interação de máquinas com seres humanos tanto como no recebimento 
de comandos por voz, interpretar um texto ou até mesmo um comando
escrito. Essa interação possui uma complexidade tão elevada que exige uma
interdisciplinaridade entre computação e linguística para obter o
resultado desejado.

As técnicas de processamento de linguagem natural realizam a ponte
entre a linguagem natural e a linguagem de máquina. Assim, com essas técnicas, é
possível tratar as palavras como informações, ou seja, podemos processá-las
e criar relações lógicas cujas informações são
compreendidas por computadores.

Assim, esse trabalho propõe a construção de agentes que possam fazer a
extração de informações de uma partida de futebol de textos jornalísticos e, em
conjunto, um Buscador para encontrar informações sobre os dados das partidas
que são retiradas pelo Extrator.

A escolha de textos jornalísticos em língua portuguesa foi feita pelo desafio de
escrever um Extrator na língua materna dos desenvolvedores. O desafio existe
por haver poucas referências e poucas ferramentas para língua portuguesa em
comparação à língua inglesa.

\newpage
\section{Objetivos}
Os objetivos do trabalho são:

\begin{itemize}
\item Criar um extrator de informações sobre uma partida de futebol de texto
jornalístico;
\item Organizar as informações extraídas em uma estrutura de dados;
\item Buscar e exibir a informação em um formato compreensível aos usuários.
\end{itemize}

Para atingir esses objetivos foi feito um estudo de processamento de linguagem natural 
e de técnicas de compilação para classificar as palavras e tirar significados
de textos.
Além disso, foi construído um módulo que também usa processamento de linguagem
natural para buscar as informações extraídas e exibi-las em páginas web.

\section{Justificativa}
O trabalho justifica-se pelo desenvolvimento da \emph{web semântica}, cujos
serviços e páginas da Internet têm significado para computadores, conseguindo interagir
 e fazer operações sobre essa rede. O objetivo do trabalho é, portanto,
 construir os agentes que fazem tal extração. Para obter significado é
 necessário o uso intenso de metadados para estruturar a informação textual da Internet, que é uma informação
desestruturada.

A escolha de textos jornalísticos foi feita pela qualidade do texto escrito,
pois possui poucos erros de ortografia e pouca ambiguidade. Esse fator facilita muito a extração de informações.

O tema futebol, todavia, foi escolhido por gosto pessoal dos autores do trabalho
e também pela facilidade de encontrar textos sobre partidas na Internet. Outro motivo
também é o conhecimento dos termos do assunto, conhecidos como \emph{jargões},
como \emph{golear}, que significa ``vitória com muitos gols''.



\newpage
\section{Divisão do Documento}
\begin{itemize}
  \item Introdução: justificativa do nosso projeto, além da presente divisão do
  documento;
  \item Referencial teórico e tecnológico: teoria envolvida nos módulos do
  projeto;
  \item Materiais e métodos: componentes utilizados para o desenvolvimento do
  projeto e sua importância nos módulos;
  \item Implementação: descrição detalhada da implementação do projeto,
  mostrando cada fase do processamento de linguagem natural do Extrator de
  informações e do Buscador;
  \item Testes e resultados: plano de testes e análise dos resultados;
  \item Considerações finais: conclusões sobre o desenvolvimento
  do sistema.
\end{itemize} 